iT邦幫忙

第 11 屆 iThome 鐵人賽

DAY 21
0
Google Developers Machine Learning

透視Google Machine Learning的奧秘系列 第 21

[Day21] GCP當中好用的API:Cloud Vision API與Video intelligence API

  • 分享至 

  • xImage
  •  

前一天我們介紹了如果說沒有機器學習該怎麼解決問題,今天來介紹Cloud Vision API和Video intelligence API

Cloud Vision API

Cloud Vision API是一個圖片檢測的API,只要給他一張圖片,他就會告訴你說在這張圖片當中有哪些物件,Vision API的核心是標籤檢測功能,會提取出圖片中的文本或圖像,然後告訴你文本的位置以及語言,也可以檢測出Logo以及地標的經緯度,而且還有辨識臉部表情,識別照片中人像的心情如何,這都讓我滿驚訝的,沒想到功能如此強大。

講者也有在影片中測試Cloud Vision API的使用過程和測試一些圖片:

範例圖片
人像表情

Cloud Vision API當中還有個功能是安全搜索,餵進去圖片後會告訴你圖片是否是合適的,並且把它分類成不同的類別,確保一些不適當的內容像是色情血腥暴力之類的內容出現。

在API當中可以查看他的JSON,記錄物件的名稱和他的座標位置:

JSON

Video intelligence API

Video intelligence API跟剛剛的Cloud Vision API很像,都是進行標籤檢測,只是他使用在影片當中,Video intelligence API會針對影片的兩種層次做描述,比較高的層面會告訴你這部影片主要是什麼?比較細微的層面會就影片當中每一場景發生什麼進行描述,Video intelligence API也會針對場景所在位置做標記、JSON格式記載相關資訊、也有識別不當內容的機制,這些功能大部分和Cloud Vision API的是一樣的。

Video intelligence API
Video intelligence API
Video intelligence API

今天先介紹到這,明天我們來介紹Cloud Speech API和Translation and NL

參考資料與圖片來源


上一篇
[Day20] 如果今天沒有機器學習該怎麼辦?
下一篇
[Day22] GCP當中好用的API:Cloud Speech API與Translation and NL
系列文
透視Google Machine Learning的奧秘30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言